آمورش داده کاوی
داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همینطور پایگاه های داده می باشد.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
آموزش داده کاوی با استفاده از WEKA
داده کاوی چیست؟
داده کاوی مجموعه تکنیک هایی می باشد که پایگاه داده های بزرگ را به منظور دستیابی به دانش، تحلیل می کند. به منظور داده کاوی امروزه از روش های ماشینی و یا نیمه ماشینی استفاده می شود که دلیل آن هم تفاوت عمده در مقیاس، وسعت و گوناگونی زمینهها و کاربردها، و نیز ابعاد و اندازههای دادههایی می باشد که امروز مورد استفاده قرار می گیرد. داده کاوی یا Data Mining در اصل به معنای استخراج اطلاعات یا الگوهای عملکرد و روابط مشخص در میان داده ها و همینطور پایگاه های داده می باشد.
داده کاوی، بهره گیری از ابزار های موجود جهت کسب دانش
داده کاوی بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبر گفته میشود که استفاده از این ابزارها منجر به یافتن سریع مدلهای آماری مورداستفاده درداده، مدلهای آماری و الگوریتمهای ریاضی میشود که این کار این به صورت خودکار و یا بر اساس تجربهای که از طریق شبکههای عصبی یا درختهای تصمیم گیری به دست میآورند، انجام می دهند. داده کاوی علاوه بر گردآوری و مدیریت داده های انبوه، تجزیه، تحلیل اطلاعات و پیش بینی را نیز انجام میدهد که پارامتر های گوناگونی را در نظر می گیرد:
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
- ۱) قواعد انجمنی یا Association که شامل الگو هایی می باشد که یک رویداد به رویدادی دیگر ارتباط پیدا می کند.
- ۲) ترتیب یا Sequence: ترتیب اجرای رویداد ها را پیگیری می کند.
- ۳) پیش بینی یا Prediction که پیش بینی یک متغیر پیوسته را انجام می دهد.
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
- ۴) طبقه بندی یا Classification که رده های موجود در داده ها را تعریف می کند و نسبت به یکریگر متمایز می کند با این هدف که بتوان از این مدل برای پیش بینی رده رکوردهایی که برچسب رده آنها ناشناخته میباشد، استفاده نمود.
- ۵) خوشه بندی یا Clustering که مجموعه ای از رکورد ها که شباهت بیشتری را نسبت به یکدیگر دارد را در یک گروه قرار می دهد.
- ۶) مصور سازی یا visualization که داده های به دست آمده را شبیه سازی می کند.
ابزار های داده کاوی
- ۱) کلمنتاین Clementine
- ۲) نرم افزار Rapid Miner
- ۳) نرم افزار WEKA
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
WEKA ابزاری متن باز برای داده کاوی در جاوا
WEKA را می توان یکی از قدرتمند ترین ابزار های موجود جهت داده کاوی دانست که یک کتابخانه متن باز می باشد که به کاربر این امکان را می دهد تا با استفاده از امکانات زبان جاوا، داده های خود را پردازش کند. WEKA توابع مختلف را برای داده کاوی در اختیار کاربر قرار میدهد. مزیت استفاده از این کتابخانه این می باشد که ابزار های متنوعی جهت پیاده سازی الگوریتم های داده کاوی را به صورت آماده دارد.
مفاهیم داده کاوی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
-
- اعمال فیلتر بر روی داده ها
-
- حذف ویژگی های غیرمفید
- گسسته سازی ویژگی های عددی
- ایجاد داده تصادفی
- انتخاب ویژگی
- خوشه بندی
- دسته بندی
- ارزیابی مدل و تست
- آشنایی با ماتریس Confusion
- آشنایی با مشخصه عملکرد سیستم
- قوانین انجمن
- آماده سازی محیط نرم افزاری برای شروع به کار با WEKA
- نصب جاوا
- نصب Eclipse
- اتصال WEKA با Eclipse
- درونریزی داده
- آشنایی با نوع داده ARFF
- تعریف ویژگی
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
- آشنایی با ساختار داده ها
- ایجاد مجموعه داده در زمان اجرا
- ذخیره داده در قالب ARFF
- اعمال فیلتر بر روی داده ها
- گسسته سازی ویژگی ها
- ابزار اعمال فیلتر دسته بندی FilteredClassifier
- انتخاب ویژگی در WEKA
- Information Gain و کاربرد آن در انتخاب ویژگی
- بررسی مولفه های اصلی
- AttributeSelectedClassifier و انتخاب خاص دسته بندی کننده
- ایجاد یک دسته بندی کننده و آموزش آن
- ایجاد دسته بندی کننده با درخت تصمیم گیری یا Decision Treesb.
- ایجاد دسته بندی کننده با استفاده از ماشین بردار پشتیبان یا SVM
- مدل های دیگر دسته بندی کننده
- ایجاد یک دسته بندی کننده اختصاصی
- نمایش نتیجه
- نمایش گرافیکی درخت به کاربر
- بررسی و ارزیابی مدل ها
- بررسی مجموعه داده ها و تست
- نمایش نتایج آماری
- جداسازی داده یادگیری
- اعتبارسنجی متقابل k-fold
- ماتریس Confusion
- منحنی ROC
- ذخیره مدل با استفاده از Serializable
- بازگردانی مدل با استفاده از deserializable
- رگرسیون
- کلاس Zero
- کلاس REPTree
- کلاس SMOreg
- کلاس MultilayerPerceptron
- قوانین ارتباطی
- الگوریتم Apriori و کشف قوانین ارتباطی
- خوشه بندی
- الگوریتم EM و نحوه خوشه بندی
- azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
09367292276
09367292276
azsoftir@gmail.com
azsoftir.com
- دسته بندی کننده خوشه ای
- خوشه بندی افزایشی
- بررسی خوشه بندی